Fundamental limitations of genomic language models for realistic sequence generation
Este estudio demuestra que los modelos de lenguaje genómico actuales, como Evo 2 y megaDNA, presentan limitaciones fundamentales al generar genomas sintéticos realistas, ya que aunque capturan estadísticas locales, fallan sistemáticamente en preservar la organización a larga distancia, las repeticiones y las restricciones evolutivas, lo que permite distinguirlos fácilmente de secuencias naturales.